91 research outputs found
Cases Denoting Path in Komi : Semantic, Dialectological and Historical Perspectives
This article examines the functions and use of Komi-Zyrian prolative cases. The theoretical background is rooted in cognitive linguistics, and the use of these cases in written Komi is studied with the methods of corpus linguistics. Our analysis shows that the two prolative cases have different distributions and functions, but there are also dialectal and grammatical factors that condition their use. Furthermore, we show that there are parallels between the distribution of these forms in different Permic languages and dialects. We contextualise these findings within Permic dialectology, and provide an analysis of how these forms are related and how they have developed in specific Komi subvarieties.Peer reviewe
Epic Tradition Shared and Transformed : Comparisons between Kolva Komi and Tundra Nenets Sung Poetry
Since the 1960s, a unique Komi singing and narrative tradition has been described in the Kolva region. These materials, sung in the Komi language, were beyond doubt born in interaction with Tundra Nenets sung poetry. Indeed, comparable Nenets songs have been documented from all the regions where Nenets is spoken. We use both published and archived materials to compare individual texts in detail, and show various folkloristic and linguistic parallels. We pay particular attention to shared motives and narrative phases, which we consider very important as in the current state of research where exact parallel texts between the languages cannot be found. These detailed parallel concepts, however, serve as an evidence of the shared origin of these narratives, and also tell us how these Nenets conceptualizations have been transformed when integrated into Komi tradition.Peer reviewe
On New Text Corpora For Minority Languages On The Helsinki korp.csc.fi Server
The korp.csc.fi server in Finland provides text corpora of multiple varieties for numerous languages large and small. The Korp infrastructure is developed by the Swedish Språkbanken in the University and Gothenburg, and the source code is released under MIT license. Open nature of the systems makes it easily transferred into new environments, and there are already numerous Korp installations available. The one we discuss is maintained by the Language Bank of Finland.Peer reviewe
Kahden suomalais-ugrilaisen yhteisön kielenvaihdon vertailevaa tarkastelua : Tuuksa Karjalassa ja Koigort Komissa
Käsittelen pro gradu -tutkimuksessani kielenvaihtoa Karjalassa ja Komissa. Molemmilla alueilla 1800-luvulla enemmistökielenä puhuttu suomalais-ugrilainen kieli on 1900-luvun aikana laajalti korvautunut venäjällä yleisenä käyttökielenä. Aiemman tutkimustiedon perusteella karjala on erittäin uhanalainen koko sen puhuma-alueella, mutta komia käytetään vielä lukuisissa yhteisöissä eri puolilla Komin tasavaltaa. Käytännössä aiempia tapaustutkimuksia on erittäin vähän, eikä ilmiön laajuutta ole yksityiskohtaisesti kartoitettu. Tutkimukseni tavoitteena on kuvata kielenvaihdon etenemistä yhdessä karjalaisessa ja yhdessä komilaisessa kylässä. Nämä kylät ovat Tuuksa Aunuksen piirissä ja Koigort Koigorodokin piirissä. Korostan, että tutkimus on käsitellyt vain pientä kylänosaa ja rajallista osuutta alueen väestöstä, joten tulokset ovat vain osin yleistettävissä laajempaan kontekstiin.
Tutkimuksen metodeina on domeenien muutoksen ja kielellisten verkostojen vertailu. Erityistä huomiota on kiinnitetty näennäisaikaiseen muutokseen. Tämän pohjalta arvioidaan eri ikäryhmien kielen käyttöä ja oppimista. Tutkimuksen aineisto on kerätty suomalais-ugrilaisen oppiaineryhmän kenttätyöharjoitusten yhteydessä ja koostuu noin 50 haastattelusta molemmilla paikkakunnilla. Molemmissa tutkimuskohteissa on käytetty samanlaista kyselykaavaketta, jota hyödynnetään soveltuvin osin tässä tutkimuksessa. Työskentely on rajoittunut yksittäisiin naapurustoihin, sillä ainoastaan näin on mahdollista kartoittaa tarkemmin informanttien keskinäisiä suhteita. Samalla esimerkiksi kielenkäytön domeenit kuten naapurit ja kauppa konkretisoituvat, sillä informantit kuvaavat samoja ympäristöjä. Käsiteltyjä domeeneja olivat näiden lisäksi perhe, koti, koulu, työ ja kylä. Erityistä huomiota kiinnitin perheen sisäisiin rooleihin.
Tutkimuksen perusteella kielenvaihto on alkanut Tuuksessa aiemmin kuin Koigortissa. Eroa voi pitää jopa yhden sukupolven suuruisena. Tuuksessa jo 1930-luvulla syntyneet ovat usein puhuneet lastensa kanssa venäjää. Suuri merkitys on kuitenkin ollut 1950-luvulla, sillä tällöin kylään muuttaneen venäläisen informantin kuvauksen perusteella paikalliset karjalaiset eivät vielä osanneet venäjää. Tuuksen aineistossa näkyy hyvin jyrkkä muutos, jossa puolison kanssa käytetty kieli on vaihtunut 1950-luvulla syntyneillä. 1960-luvulla venäjästä on tullut sisarusten keskeinen käyttökieli. Myös Koigortissa puolison kanssa käytetty kieli on perhekohtaisesti vaihtunut 1950-luvulla, mutta prosessi ei ole niin kokonaisvaltainen kuin Tuuksessa.
Tästä huolimatta kielenvaihto ei ole saavuttanut päätepistettään kummassakaan yhteisössä. Tutkimus kuvastaa erittäin hyvin kielenvaihdon hitautta. Tietyt henkilöt ja ikäryhmät jatkavat kielenvaihdossa väistyvän kielen puhumista vielä kauan kielenvaihdon alettua. Kielellisten verkostojen analyysi kuvasi sitä, kuinka molempia kieliä paljon käyttäneiden keskuudessa väistyvän kielen käyttö painottui juuri vuorovaikutukseen iäkkäimpien ikäkohorttien kanssa. Kielen välittyminen lapsille näyttää jatkuvan paljon kauemmin, kuin yhteisöä nopeasti tarkastellen arvelisi. Tämän katkeamisen voi yleensä rajata hyvin tarkasti tiettyjen henkilöiden kuolemaan tai heidän vähentyneeseen osuuteensa lasten hoidossa. Erityistä huomiota on kiinnitettävä kielitaidon assosioitumiseen eri ikäryhmiin. Kielenvaihtoa käsittelevät diskursiiviset käytänteet voivat selittää kielenvaihtoa paremmin, kuin kielitaidon yksinkertainen arviointi. Jatkotutkimuksen kannalta suositellaan, että kiinnitettäisiin huomiota passiivisen kielitaidon merkitykseen sekä lateraalisiin verkostoihin, joissa kieltä opitaan.
Molemmissa kylissä paikallisen suomalais-ugrilaisen kielen voi vielä sanoa välittyvän lapsille, mutta Tuuksessa ei vaikuta olevan lapsia, jotka olisivat karjalan aktiivikäyttäjiä. Koigortissa puolestaan kieli on sporadisesti säilynyt nuorten käyttämänä ja osaamana kielenä. On huomionarvoista, että Koigorodokin piirissä yksittäinen lähiseudun kylä, Griva, on säilynyt ilmeisen kominkielisenä. 1970-luvulla lakkautetusta Kobran kylästä on siirtynyt paljon väestöä Koigortiin, mikä näyttää vahvistaneen kylän kominkielisiä verkostoja. Nyt tavatuilla komia aktiivisesti käyttäneillä nuorilla on kaikilla sukulaisuussuhteita ainakin toiseen näistä kylistä
Lemmatization of Historical Old Literary Finnish Texts in Modern Orthography
Texts written in Old Literary Finnish represent the first literary work ever
written in Finnish starting from the 16th century. There have been several
projects in Finland that have digitized old publications and made them
available for research use. However, using modern NLP methods in such data
poses great challenges. In this paper we propose an approach for simultaneously
normalizing and lemmatizing Old Literary Finnish into modern spelling. Our best
model reaches to 96.3\% accuracy in texts written by Agricola and 87.7\%
accuracy in other contemporary out-of-domain text. Our method has been made
freely available on Zenodo and Github.Comment: la 28e Conf\'erence sur le Traitement Automatique des Langues
Naturelles (TALN
On the questions in developing computational infrastructure for Komi-Permyak
There are two main written Komi varieties, Permyak and Zyrian. These are mutually intelligible but derive from different parts of the same Komi dialect continuum,representing the varieties prominent in the vicinity and in the cities of Syktyvkar and Kudymkar,respectively. Hence,they share a vast number of features, as well as the majority of their lexicon, yet the overlap in their dialects is very complex. This paper evaluates the degree of difference in these written varieties based on changes required for computational resources in the description of these languages when adapted fromthe Komi-Zyrian original. Primarily these changes include the FST architecture, but we are also looking at its application to the Universal Dependencies annotation scheme in the morphologies of the two languages.Peer reviewe
- …